Wpływ Social Media na życia studentów

1 Wprowadzenie

W dobie powszechnej cyfryzacji media społecznościowe stały się nieodłącznym elementem codzienności akademickiej, kształtując sposób, w jaki studenci komunikują się, spędzają wolny czas i budują relacje. Celem niniejszego raportu jest wielowymiarowa analiza wpływu korzystania z platform społecznościowych na dobrostan studentów. Szczególny nacisk położono na zbadanie korelacji między czasem ekranowym a zdrowiem psychicznym, jakością snu oraz wynikami w nauce.

Raport zawiera przegląd kluczowych statystyk, wizualizację rozkładu zmiennych oraz wnioski płynące z analizy zależności między cechami demograficznymi a wzorcami zachowań cyfrowych. Analizowany zbiór danych składa się z 705 obserwacji oraz 13 zmiennych, obejmujących m.in. dane demograficzne, preferowane platformy, czas użytkowania oraz wskaźniki subiektywnego poczucia uzależnienia.

Projekt pomoże odpowiedzieć na postawione przez nas pytania badawcze, takie jak: - Czy istnieje statystycznie istotna zależność między poziomem uzależnienia od social mediów a zdrowiem psychicznym studentów, - Jak korzystanie z mediów społecznościowych wpływa na wyniki akademickie? -

1.1 Opis danych

Analizowany zbiór danych składa się z 13 zmiennych dotyczących studentów z różnych krajów. Dane obejmują trzy kluczowe obszary:

Demografię (m.in. wiek, płeć, poziom edukacji).

Aktywność w sieci (średni czas korzystania, najczęściej używana platforma).

Wskaźniki dobrostanu (poziom uzależnienia, ocena zdrowia psychicznego, jakość snu oraz wpływ na wyniki w nauce).

Zbiór jest kompletny i nie zawiera brakujących wartości.

2 Porządkowanie danych

2.1 Braki danych

W danych znajduje się 100 % kompletnych wartości.

2.2 Walidacja danych

  • czy wiek przyjmuje wartości od 16 - 25?
  • czy godziny przyjmują wartości 0 - 24?
  • czy wszystkie wartości liczbowe są większe od 0?
  • czy mental health score i addicted score przyjmują wartości 1 - 10?
  • płeć - kobieta lub mężczyzna?
  • poziom wykształcenia - szkoła średnia, studia I stopnia lub studia II stopnia
  • status związku - wolny, w związku, “to skomplikowane”
  • czy wpływa na wyniki akademickie - tak lub nie?
reguly <- validator(
Age >= 16 & Age <= 25,
Gender %in% c("Female", "Male"),
Academic_Level  %in% c("High School", "Undergraduate", "Graduate"),
Avg_Daily_Usage_Hours > 0 & Avg_Daily_Usage_Hours < 24,
Affects_Academic_Performance %in% c("Yes", "No"),
Sleep_Hours_Per_Night >= 0 & Sleep_Hours_Per_Night <= 24,
Mental_Health_Score >= 1 & Mental_Health_Score<=10,
Relationship_Status %in% c("In Relationship", "Single", "Complicated"),
Addicted_Score >= 1 & Addicted_Score <= 10
)
cf <- confront(dane, reguly, key="Student_ID")

barplot(cf)
## Warning: The 'barplot' method for confrontation objects is deprecated. Use
## 'plot' instead

3 Wizualizacja danych

3.1 Charakterystyka demograficzna badanej grupy studenckiej

3.1.1 Rozkład Płci i Poziomu Akademickiego

dane$Academic_Level <- factor(dane$Academic_Level, 
                            levels = c("High School", "Undergraduate", "Graduate"))
dane$Gender <- factor(dane$Gender,
                  levels = c("Male", "Female")
)

ggplot(dane, aes(x = Academic_Level, fill=Gender)) +
  geom_bar(position = "dodge") +
  labs(title = "Rozkład płci i poziomu akademickiego",
       x = "Poziom akademicki",
       y = "Liczba studentów") +
  theme_minimal()

Analiza struktury demograficznej wskazuje na równomierny rozkład płci (blisko 50/50), natomiast w podziale na poziom edukacji przeważają osoby na studiach I i II stopnia, stanowiąc łącznie ponad 96% próby.

3.1.2 Wiek badanych

ggplot(dane, aes(x = Age)) +
  geom_histogram(binwidth = 0.5, fill = "skyblue", color = "black") +
  labs(title = "Wiek badanych studentów",
       x = "Wiek",
       y = "Liczba studentów") +
  theme_minimal()

Większość badanych to osoby w wieku od 19 do 23 lat, co wskazuje na silną koncentrację danych wokół typowego wieku studenckiego. Średnia wieku w próbie wynosi około 21 lat.

3.2 Intensywność Używania Social Mediów

3.2.1 Średni czas użycia

ggplot(dane, aes(x = Avg_Daily_Usage_Hours)) +
  geom_histogram(binwidth = 1, fill = "#9f2042", color = "#6c0d27") +
  labs(title = "Średni czas użycia social mediów dziennie",
       x = "Średni czas użycia (h)",
       y = "Liczba studentów") +
  theme_minimal()

Większość studentów spędza w mediach społecznościowych od 4 do 6 godzin dziennie, przy czym średnia dla całej grupy wynosi blisko 5 godzin. Rozkład wskazuje, że znaczna część badanych deklaruje wysoką aktywność cyfrową, przekraczającą 4 godziny na dobę.

3.2.2 Najczęściej używane platformy

dane %>%
mutate(top_5 = fct_lump_n(Most_Used_Platform, n = 4, other_level = "Inne")) %>%
  ggplot(aes(x = top_5)) +
  geom_bar(fill = "#6c0d27") +
  labs(title = "Najczęściej używane platformy social media",
       x = "Platforma",
       y = "Liczba studentów") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

3.3 Wpływ social mediów na wyniki akademickie

wykres <- dane %>%
  count(Addicted_Score) %>%
  ggplot(aes( x = Addicted_Score, y=n)) +
  geom_point(color= "blue")+
  geom_line(color= "blue")+
  labs(title = "Poziom uzależnienia uczniów",
       x = "Poziom uzależnienia",
       y = "Liczba uczniów") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5)
  )
plotly:: ggplotly(wykres)

Największa liczba badanych koncentruje się na umiarkowanych i wyższych poziomach uzależnienia, co wskazuje na powszechność intensywnego korzystania z mediów społecznościowych w badanej grupie.

ggplot(dane, aes(x = Affects_Academic_Performance)) +
  geom_bar(fill = "#6c0d27", width= 0.5)+
  scale_x_discrete(
    labels = c(
      "Yes" = "Tak",
      "No"  = "Nie"
    )
  ) +
  labs(title = "Wpływ social mediów na wyniki akademickie",
       x = "Czy social media wpływają na wyniki akademickie?", 
       y = "Liczba studentów")+
         theme_minimal()+
   theme(
    plot.title = element_text(hjust = 0.5)
  )

Zdecydowana większość badanych zadeklarowała, że korzystanie z social mediów wpływa na ich osiągnięcia akademickie, podczas gdy mniejsza część respondentów nie dostrzega takiego wpływu. Uzyskane wyniki sugerują, że studenci w dużym stopniu są świadomi oddziaływania mediów społecznościowych na wyniki w nauce.

3.4 Social media a zdrowie psychiczne

ggplot(dane, aes(x= Avg_Daily_Usage_Hours, y = Mental_Health_Score))+
geom_smooth(method = "lm", se = F) +
 labs(
    title = "Zależność między uzależnieniem od social mediów a zdrowiem psychicznym",
    x = "Poziom uzależnienia",
    y = "Poziom zdrowia psychicznego"
  ) +
  theme_minimal()+
  theme(
    plot.title = element_text(hjust = 0.5)
  )
## `geom_smooth()` using formula = 'y ~ x'

Wykres przedstawia linię regresji liniowej obrazującą zależność pomiędzy poziomem uzależnienia od social mediów a zdrowiem psychicznym studentów. Wraz ze wzrostem poziomu uzależnienia obserwuje się spadek wyników zdrowia psychicznego.

3.5 Wpływ social mediów na relacje interpersonalne

ggplot(dane, aes(x = Avg_Daily_Usage_Hours, y = Conflicts_Over_Social_Media)) +
  geom_point(alpha = 0.5) +
  geom_smooth(method = "lm", col = "blue") +
  labs(title = "Korelacja czasu używania social mediów z liczbą konfliktów") +
  theme_light()
## `geom_smooth()` using formula = 'y ~ x'

Wykres przedstawia zależność pomiędzy przeciętną liczbą godzin używania social mediów a liczbą konfliktów spowodanych social mediami wraz z przeiwdywaną linią trendu. Przy wzroście średniego dziennego użytkowania social mediów zauważa się również wzrost liczby konfliktów w tym temacie.

4 Statystyki opisowe

4.1 Statystyki opisowe dla zmiennej Avg_Daily_Usage_Hours w podziale na 5 najczęściej używanych platform

Ze względu na nierówną liczebność obserwacji w poszczególnych kategoriach zmiennej Most Used Platform, analizę ograniczono do pięciu najczęściej deklarowanych platform społecznościowych.

top5_platform <- dane %>%
  count(Most_Used_Platform, sort = TRUE) %>%
  slice_head(n = 5) %>%
  pull(Most_Used_Platform)

Avg_Daily_Usage_Hours <- dane %>%
  filter(Most_Used_Platform %in% top5_platform) %>%
  group_by(Most_Used_Platform) %>%
  summarise(
    N = n(),
    Min = min(Avg_Daily_Usage_Hours),
    Q1 = quantile(Avg_Daily_Usage_Hours, 0.25),
    Mediana = median(Avg_Daily_Usage_Hours),
    Średnia = mean(Avg_Daily_Usage_Hours),
    Q3 = quantile(Avg_Daily_Usage_Hours, 0.75),
    Max = max(Avg_Daily_Usage_Hours),
    SD = sd(Avg_Daily_Usage_Hours),
    IQR = IQR(Avg_Daily_Usage_Hours)
  )
    
kable(
  Avg_Daily_Usage_Hours,
  digits = 2,
  caption = "Statystyki opisowe Avg_Daily_Usage_Hours dla 5 najczęściej używanych platform"
) %>%
  kable_paper(full_width = FALSE)
Statystyki opisowe Avg_Daily_Usage_Hours dla 5 najczęściej używanych platform
Most_Used_Platform N Min Q1 Mediana Średnia Q3 Max SD IQR
Facebook 123 2.3 3.7 4.50 4.51 5.00 7.2 1.11 1.30
Instagram 249 2.2 4.0 4.70 4.87 5.70 8.5 1.24 1.70
TikTok 154 3.3 4.6 5.30 5.35 5.97 8.4 1.05 1.38
Twitter 30 2.1 4.4 4.65 4.87 5.47 6.3 0.87 1.07
WhatsApp 54 5.5 6.0 6.45 6.48 7.00 7.5 0.59 1.00

Osoby, które wskazały WhatsApp jako najczęściej używaną aplikację, spędzają przeciętnie najwięcej czasu ogółem w mediach społecznościowych w ciągu dnia. Wysoki łączny czas korzystania obserwuje się również wśród użytkowników TikToka, natomiast osoby deklarujące Facebook, Instagram lub Twitter jako najczęściej używaną platformę spędzają w mediach społecznościowych średnio mniej czasu. Największe zróżnicowanie dziennego czasu korzystania występuje wśród użytkowników Instagrama, a najmniejsze w grupie użytkowników WhatsAppa.

Tabela 4.2. Tabela rozkładu poziomu uzależnienia w podziale na TOP 5 najczęściej używanych platform
platform boxplot histogram points1
Facebook
Instagram
TikTok
Twitter
WhatsApp

4.2 Statystyki opisowe dla zmiennej Addicted Score w podziale na płeć

raport <- list("Addicted Score" = 
                 list("Min"= ~ min(Addicted_Score), 
                      "Max"= ~ max(Addicted_Score), 
                      "Q1"= ~ quantile(Addicted_Score,0.25), 
                      "Mediana"= ~ round(median(Addicted_Score),2), 
                      "Q3"= ~ quantile(Addicted_Score,0.75), 
                      "Średnia"= ~ round(mean(Addicted_Score),2), 
                      "Odch. std."= ~ round(sd(Addicted_Score),2), 
                      "IQR"= ~ round(IQR(Addicted_Score),2), 
                      "Odch. ćwiartkowe"=~round(IQR(Addicted_Score)/2,2), 
                      "Odch. std. w %"=~round((sd(Addicted_Score)/mean(Addicted_Score)),2), "Odch. ćwiartkowe w %"=~round((IQR(Addicted_Score)/median(Addicted_Score)),2), "Skośność"=~round(skew(Addicted_Score),2), "Kurtoza"=~round(kurtosi(Addicted_Score),2) ))
tabela_gender <- dane %>%
  group_by(Gender) %>%
  summarise(
    Min = min(Addicted_Score),
    Q1 = quantile(Addicted_Score, 0.25),
    Mediana = median(Addicted_Score),
    Q3 = quantile(Addicted_Score, 0.75),
    Max = max(Addicted_Score),
    Średnia = mean(Addicted_Score),
    SD = sd(Addicted_Score),
    Skośność = psych::skew(Addicted_Score),
    Kurtoza = psych::kurtosi(Addicted_Score)
  )

kable(tabela_gender,
      digits = 2,
      caption = "Tabela 4.3. Statystyki opisowe Addicted_Score w podziale na płeć") %>%
  kable_paper("striped", full_width = FALSE)
Tabela 4.3. Statystyki opisowe Addicted_Score w podziale na płeć
Gender Min Q1 Mediana Q3 Max Średnia SD Skośność Kurtoza
Male 2 5 7 7 9 6.36 1.45 -0.45 -0.82
Female 3 5 7 8 9 6.52 1.71 -0.24 -1.05

Średnie i mediany wyników uzależnienia są podobne dla obu płci, przy czym kobiety mają nieco wyższą średnią i większą zmienność. Różnice między mężczyznami a kobietami są niewielkie i nie wskazują na znaczącą przewagę jednej grupy pod względem poziomu uzależnienia.

4.3 Macierz korelacji między poziomem uzależnienienia od social mediów, zdrowiem psychicznym, wiekiem i średnią liczbą używania social mediów

Zachodzi pełną zależność ujemną między poziomem uzależnieniem a zdrowiem psychicznym (-0.95), co oznacza, że wzrostowi uzależnienia, zawsze towarzyszy spadek zdrowia psychicznego. Kluczowym czynnikiem wpływającym na oba te parametry jest średni dzienny czas korzystania z mediów społecznościowych, który silnie koreluje z poziomem uzależnienia (0.83) oraz obniżeniem zdrowia psychicznej (-0.80). Jednocześnie wiek badanych nie ma istotnego znaczenia dla tych relacji, wykazując jedynie śladowe i nieznaczące statystycznie powiązania z resztą zmiennych.

5 Wnioskowanie statystyczne

ggbetweenstats(dane, Gender, Addicted_Score)

ggbetweenstats(dane, Academic_Level , Addicted_Score)

anova <- aov(Mental_Health_Score ~ Most_Used_Platform, data=dane)

dane |>
aov(Mental_Health_Score ~ Most_Used_Platform, data=_) |>
tidy() |>
kbl() |>
kable_classic(full_width = FALSE, html_font="Cambria")
term df sumsq meansq statistic p.value
Most_Used_Platform 11 229.1215 20.8292240 22.89156 0
Residuals 693 630.5665 0.9099083 NA NA

5.1 Czy istnieje zależność między poziomem edukacji a najczęściej używaną aplikacją?

ggpiestats(dane, Academic_Level, Most_Used_Platform, bf.message = FALSE)